توسعه روشهای مبتنی بر فرض توزیع غیرگوسی برای بهسازی گفتار
thesis
- وزارت علوم، تحقیقات و فناوری - دانشگاه یزد - دانشکده مهندسی برق و کامپیوتر
- author محبوبه کارگریان مروستی
- adviser حمیدرضا ابوطالبی محمدرضا تابان
- Number of pages: First 15 pages
- publication year 1391
abstract
با توجه به کاربرد روزافزون سیستم های گفتاری در زندگی امروزی، کارهای بسیاری در زمینه بهسازی و بازشناسی گفتار صورت گرفته که در همه این کاربردها وجود نویز و پژواک باعث کاهش کارآیی سیستم های گفتاری می شود. تاکنون تعداد زیادی از الگوریتم های بهسازی گفتار براساس تخمین دامنه طیف سیگنال گفتار و هم چنین تخمین ضرایب حقیقی و موهومی طیف گفتار مبتنی بر معیار mmse و map و با فرض گوسی بودن مولفه های دکارتی ضرایب dft سیگنال گفتار ارائه شده اند. در سال های اخیر محققان به دنبال واردکردن مدل های احتمالاتی دقیق تری برای مولفه های دکارتی ضرایب dft سیگنال گفتار هستند . در این پایان نامه، ابتدا به بررسی سیستم های تک کاناله تخمین دامنه سیگنال تمیز با فرض گوسی بودن مولفه های دکارتی ضرایب dft سیگنال گفتار و هم چنین سیستم تک کاناله تخمین مولفه های دکارتی ضرایب سیگنال تمیز با همان فرض گوسی بودن ضرایب می پردازیم . در ادامه نگاهی به سیستم های بهسازی که مبتنی برفرض غیرگوسی برای مولفه های دکارتی ضرایب dft سیگنال گفتار هستند، داریم . در این زمینه، نخست به کمک معیار kullback به دنبال تابع توزیعی هستیم که بر هیستوگرام دامنه گفتار منطبق شود . در این راستا با استفاده از توزیع سوپرگوسین و با تغییر پارامترهایش از نظر معیار kullback به توزیع نمایی رسیدیم که بر هیستوگرام دامنه گفتار منطبق تر است و تخمین گر دامنه طیف سیگنال گفتار را با فرض توزیع نمایی برای دامنه گفتار براساس معیار mmse بدست آوردیم . در ادامه این پایان نامه ، روش تخمین مرتبه متغیر mmse با فرض سوپرگوسین بودن دامنه گفتار را مورد بازنگری قرار داده و تخمین گرهای جدید را استخراج می کنیم. شبیه سازی ها نشان می دهند که با در نطرگرفتن توزیع نمایی برای دامنه گفتار نسبت به حالتی که ضرایب توزیع لاپلاس یا گوسی دارند بهسازی بیشتری از نظر معیار segsnr بدست می آید .
similar resources
بهسازی گفتار با تخمین گر کمترین میانگین مربعات خطا برپایه توزیع مخلوط لاپلاس برای گفتار
In this paper an estimator of speech spectrum for speech enhancement based on Laplacian Mixture Model has been proposed. We present an analytical solution for estimating the complex DFT coefficients with the MMSE estimator when the clean speech DFT coefficients are mixture of Laplacians distributed. The distribution of the DFT coefficients of noise are assumed zero-mean Gaussian.The drived MMSE...
full textبهسازی گفتار با تخمین گر کمترین میانگین مربعات خطا برپایه توزیع مخلوط لاپلاس برای گفتار
در این مقاله یک روش بهسازی گفتار آماری با فرض توزیع مخلوط لاپلاس برای گفتار، برای تخمین سیگنال گفتار تمیز (بدون نویز) از سیگنال گفتار نویزی ارائه شده است. در روش پیشنهادی، ضرایب تبدیل فوریه زمان کوتاه گسسته سیگنال گفتار با استفاده از تخمین گر کمترین میانگین مربعات خطا، بدست می آید. در این تخمین، فرض می شود که تابع چگالی احتمال ضرایب تبدیل فوریه سیگنال تمیز و نویز به ترتیب، مخلوط لاپلاس و گوسی ب...
full textبهسازی گفتار مبتنی بر روش ترکیبی تفاضل طیفی و برنامه نویسی ژنتیک
در بیشتر محیط های زندگی، نویزهای مختلفی حضور دارد که داده های صوتی را تخریب می کند. در این مقاله روشی را معرفی می کنیم که در آن با استفاده از برنامه نویسی ژنتیک، نویز افزوده شده به داده های صوتی کاهش داده می شود تا داده های با کیفیت بهتری به دست آید. به این منظور ترکیب دو روش تفاضل طیفی و برنامه نویسی ژنتیک برای بهسازی گفتار پیاده سازی شده است. در این روش در مرحله اول، نویز به روش تفاضل طیفی کا...
full textبهسازی وفقی سیگنال گفتار در محیطهای واقعی با استفاده از ساختار ترکیبی مبتنی بر شکلدهندههای پرتو و فیلتر پسینه
تنوع میدانهای نویزی حاکم بر محیطهای واقعی، طراحی سیستم واحدی را که قادر به حذف کامل همه اغتشاشات محیطی باشد، با مشکل مواجه میکند. لذا، داشتن یک شناخت اولیه از میدانهای نویزی موجود در محیط و بررسی نوع اثر هر یک بر روی سیگنال گفتار، گام مؤثری در جهت فرآیند بهسازی محسوب میشود. در این مقاله، ضمن بررسی نویزهای اساسی موجود در زمینه گفتار ضبطشده در شرایط واقعی، به ارزیابی میدانهای نویزی پایینگ...
full textاستخراج ویژگیهای مبتنی بر مدلسازی خطی تراژکتوری گفتار جاسازی شده در فضای بازسازی شده فاز برای سیستم بازشناسی گفتار
تحقیقات اخیر نشان میدهد که تظاهرات غیرخطی و آشوبی سیگنال گفتار میتواند در حوزة فضای بازسازی شده فاز (RPS) مطالعه شود. تئوری جاسازی برمبنای محورهای تأخیری، ابزار مناسبی برای بررسی تراژکتورهای گفتاری در RPS است. تاکنون از مشخصههای تراژکتورهای گفتاری به ندرت در سیستمهای کاربردی بازشناسی گفتار استفاده شده است. از اینرو در این مقاله روش استخراج ویژگی جدیدی براساس پارامترهای مدلسازی خطی مبتنی بر...
full textMy Resources
document type: thesis
وزارت علوم، تحقیقات و فناوری - دانشگاه یزد - دانشکده مهندسی برق و کامپیوتر
Hosted on Doprax cloud platform doprax.com
copyright © 2015-2023